标签: Coding Agent

Agentic RL：一篇大综述告诉你 RL 怎么把 Agent 从写死的脚本变成自适应系统

2026-07-03

25 位作者、500 篇参考文献、TMLR 发表。这篇 survey 形式化了从 LLM RL（RLHF/DPO）到 Agentic RL 的范式转变，并给出了以能力维度和任务域两条轴线的完整分类法。我们翻译并解读了核心框架和与 Coding Agent 最相关的部分。

AgentRLSurveyTranslationCoding Agent
SWE-bench Verified 30 个月：从 1.96% 到 80.9%，Coding Agent 是怎么做到的

2026-07-02

30 个月，从 1/50 到 4/5。本文翻译并解读 AgentMarketCap 的 SWE-bench Verified 完整演进史，拆解每个跳变的驱动因子，以及在 saturation 之后该看什么。

AgentBenchmarkSWE-benchTranslationCoding Agent